Economie du document (Bloc-notes de Jean-Michel Salaün)

Repérage de données sur l'économie des documents dans un environnement numérique

Aller au contenu | Aller au menu | Aller à la recherche

Mot-clé -

Fil des billets

vendredi 11 avril 2008

Une explication de la popularité de Google

Voilà un article qui risque d'intéresser du monde, depuis ceux qui travaillent sur le traitement automatique de la langue jusqu'à ceux qui analysent les avantages concurrentiels en passant par les professionnels de la redocumentarisation ;-).

The Retrieval Effectiveness of Web Search Engines: Considering Results Descriptions, Dirk Lewandowski, Pre-print d'un article à paraître dans Journal of Documentation, Pdf, repéré par Marc Duval ici.

Il s'agit d'une étude classique des performances de différents moteurs en Allemagne à partir de la pertinence des résultats notés par un groupe de testeurs. Au final, les deux principaux moteurs, Yahoo! et Google arrivent pratiquement à égalité pour la pertinence des résultats. Mais, extrait de la conclusion (trad JMS) :

Alors pourquoi les internautes préfèrent Google ? Il peut y avoir de nombreuses raisons, mais nous pensons par cette enquête pouvoir en ajouter une, jusqu'ici négligée : la description des résultats. Là, il y a une différence considérable entre Google et Yahoo!. Google propose de loin le plus grand nombre (et le plus grand ratio) de descriptions pertinentes. Pourtant, il est intéressant de remarquer que Google n'utilise pas des outils vraiment différents de ses concurrents (tous les moteurs utilisent KWIC, pour la plupart des situations), mais il semble que l'identification des parties pertinentes du document utilisées pour la description fonctionne mieux pour ce moteur.

jeudi 01 novembre 2007

Web-média : logiques publiques vs intérêts commerciaux

Je n'ai pas beaucoup de temps pour développer, mais plusieurs billets, études et analyses récents méritent d'être cités, car ils montrent que les logiques publiques et commerciales cherchent leurs marques pour structurer le Web-média :

  • du côté des logiques publiques, par exemple :
    • Le rapport de l'OCLC Sharing, Privacy and Trust in Our Networked World, 280p. Pdf, qui exhorte les bibliothèques à prendre toute leur place sur le Web 2.0.
    • Les hésitations des bibliothèques face aux sirènes de Google Books. Voir le billet du BBF.
    • Ou, plus ambitieuse, mais non encore assumée par les autorités gouvernementales, la proposition déjà signalée de stratégie canadienne sur l'information numérique, ici.
  • Du côté des logiques commerciales :
    • La stratégie de Google sur les standards ouverts et leur relation avec la publicité. On lira à ce sujet deux billets très éclairants, l'un de Olivier Ertzscheid, l'autre de Jean-Marie Le Ray. Il ne faut donc pas confondre standard ouvert et recherche ou non du profit. Dans certains cas les problématiques se contredisent, dans d'autres elles marchent ensemble. Tout dépend du contexte et de la stratégie. La volonté de Google en faisant ce choix me parait double : fluidifier le Web pour augmenter le trafic global (et donc valoriser le leader sur le marché publicitaire) et fragiliser son concurrent potentiel Microsoft, le seul à pouvoir le contrer en terme de puissance financière. Actu du 04-10-2007 : à complèter et actualiser avec ce long, très fouillé et nouveau billet d'Olivier.
    • L'évolution explosive du marché publicitaire en ligne. Voir le billet de D. Durand à ce sujet.
    • Ou encore, la difficulté à valoriser des contenus sur Internet. Les remarques d'E. Parody sur les revenus ridicules générés par DailyMotion pour les producteurs de vidéos sont particulièrement éclairantes.

De plus en plus clairement, mais non sans hésitation, le Web-média se construit entre le modèle télévisuel et le modèle bibliothéconomique et il semble bien que son économie sera mixte.

samedi 20 octobre 2007

L'archivistique théorise la bibliothèque numérique (sans les Québécois ?)

Quand j'ai traversé l'Atlantique pour m'installer au Québec, il y a maintenant deux ans, je n'avais qu'une connaissance lointaine de l'archivistique. J'en ai découvert la richesse à Montréal où elle est très vivante, tout particulièrement dans la prise en compte des documents actifs et semi-actifs, avec, par exemple, des outils comme le calendrier de conservation. On trouvera ici un document de l'EBSI sur la terminologie de base en archivistique avec une bibliographie. Ceci m'avait amené à constater les relations avec le développement des bibliothèques numériques et à proposer (ici) un néologisme, plus ou moins heureux pour les puristes de la langue, mais que je crois très parlant : archithèque.

Aussi, j'ai applaudi des deux mains, quand j'ai pris connaissance de cette communication :

Ross Seamus, Digital Preservation, Archival Science and Methodological Foundations for Digital Libraries, ECDL 2007. Pdf

Extraits (trad JMS) :

En réfléchissant aux bibliothèques numériques, on s'aperçoit rapidement qu'elles sont peut-être bibliothèques de nom, mais archives de nature. Le contenu qu'elles accueillent est, pour l'essentiel, unique et n'a pas vraiment besoin d'être détenu ailleurs car les services en réseau font qu'il peut être offert n'importe où et n'importe quand à partir d'une source unique. Quand les usagers accèdent à ce contenu, ils s'attendent à pouvoir lui faire confiance, vérifier son authenticité (mais pas nécessairement sa fiabilité), ils demandent la connaissance de son contexte de création et des preuves de sa provenance. Il s'agit des procédures connues de l'archivistique dont le cadre théorique a été développé et a été mis en pratique dans la conception, la gestion et l'utilisation des fonds. (..) (p. 4-5)

Je suggèrerais, avec modestie, que les bibliothèques numériques adoptent une position théorique. Comme je l'ai suggéré plus haut la science des bibliothèques est dépourvue de fondements théoriques et des connaissances de base pertinentes pour le monde touffu du numérique. L'archivistique, avec ses principes d'unicité, de provenance, de classification et de description, d'authenticité, d'évaluation et ses outils comme la diplomatique pourrait nous donner un cadre pour une fondation théorique des bibliothèques numériques. (..) (p. 10)

Mais je regrette de n'y trouver cité aucun auteur québécois. Au moment où la ville de Québec s'apprête à recevoir, les 11-17 novembre, la Conférence internationale de la Table ronde des archives (CITRA), il serait peut-être temps que l'archivistique québécoise se rende plus visible et plus ambitieuse. Sinon, elle risque de passer à côté d'enjeux dont on vient de voir l'importance, alors même qu'elle dispose, me semble-t-il, des atouts pour jouer en première ligne.

Actu du 9 juin 2008

Seamus Ross sera à partir de janvier 2009 le nouveau doyen de la Faculté des sciences de l'information de l'Université de Toronto (ou plutôt de la Faculté d'Information, puisque tel est son nouveau nom : Faculty of Information), un apport de qualité pour les Canadiens.

dimanche 06 mai 2007

Cellulaire japonais mieux que couteau suisse ?

L'Atelier propose un dossier sur le mobile (téléphone cellulaire) au Japon. On y constate que le cellulaire japonais a déjà bien plus de lames que le couteau suisse auquel j'avais comparé l'iPhone. Extrait :

Le mobile y est déjà un outil à tout faire, capable de remplacer un grand nombre d'objets de la vie quotidienne: porte monnaie électronique, carte bancaire, clés d'appartement, carte scolaire des enfants, badge d'entreprise, PDA, télévision mobile, radio, baladeur MP3, appareil photo, carte de transport, carte de crédits, coupon de réduction, billet de train ou d'avion, système de navigation GPS, etc.

Le plus parlant est la vidéo ramenée par l'Atelier. On pourra mettre en contrepoint moqueur celle-là qui avait été signalée par P Schweitzer dans un commentaire. À mon avis la question posée dans mon billet est toujours ouverte.

samedi 31 mars 2007

Gouvernance de l'Internet : US/Chine, Documents/Objets

À lire absolument un entretien (avec qui ? je ne sais cela n'est pas indiqué dans la version en ligne !) très clair, précis et percutant, sur les enjeux politiques et commerciaux de la gouvernance d'Internet publié dans le Monde. Il souligne en particulier les divergences entre les US et la Chine ou entre l'internet traditionel et celui des objets :

Qui contrôlera demain Internet ? LE MONDE | 31.03.07 | 13h55 Propos recueillis par Stéphane Foucart

Extraits :

La Chine a essayé à plusieurs reprises, de s'éloigner des standards techniques de l'Internet. Ces tentatives auraient pu aboutir à la fragmentation ou à la balkanisation du réseau, c'est-à-dire la formation d'"îlots" peu connectés entre eux. Mais la Chine peut-elle encore se permettre de créer un Réseau incompatible avec le reste du monde ? Elle a besoin des innovations de l'Ouest pour alimenter une croissance qui est devenue cruciale pour la survie politique du régime. Si l'Iran a décidé récemment de réduire le débit des accès Internet de ses citoyens afin de freiner les échanges avec l'Occident, de telles mesures ne pourraient plus être adoptées en Chine. (..)

Si le premier milliard d'internautes s'est connecté au Réseau par le biais des ordinateurs, le deuxième milliard sera connecté à Internet par le biais de toutes sortes d'objets, qu'il s'agisse des produits alimentaires, des vêtements ou des livres... à mesure que les codes-barres présents sur les objets manufacturés seront remplacés par des puces sans contact (ou puces RFID, comme la puce qui équipe la carte Navigo des Franciliens).

Le consortium mondial de gestion des codes-barres, EPC Global, a choisi un système qui permettra à terme de stocker sur Internet toutes les informations relatives à la vie de ces objets (lieu de fabrication, acheminement, contrôles effectués, etc.). Ce changement vers un "Internet des objets" sera effectué pour des raisons logistiques, d'économie et de traçabilité. Cela générera d'importantes économies pour les distributeurs. (..)

En effet, s'il devient possible de connaître les mouvements de tous les objets et personnes sur l'ensemble de la planète, le gouvernement qui contrôlera ce système détiendra un pouvoir qu'aucun gouvernement n'a jusqu'ici rêvé de posséder.

Réflexions d'escalier le 01-04-2007 :

1) Le vieux débat du NOMIC (Nouvel Ordre Mondial de l'Information et de la Communication) est réactivé sur le Web. Il se décline différemment puisque le réseau des réseaux se joue des frontières, mais il est toujours aussi ambigu entre d'une part une tentation très forte des États pour contrôler la circulation des messages et, de l'autre, une dynamique de marché qui favorise certains joueurs. Au moment où la convention sur la diversité culturelle est entrée en vigueur, il serait utile de mieux tirer les leçons des batailles antérieures. On trouvera une bonne introduction sur cette question dans : Alegre Alan, O'Siochru Sean, Droits de la communication, in Enjeux de mots, C&F Éditions, 2005.

2) La montée de l'Internet des objets risque de séparer plus radicalement l'utilisation du réseau en une partie gestion de service et une partie Web-média dont j'essaie de souligner les contours, billet après billet dans ce blog.

Actu du 4 avril : Donc il s'agit de Bernard Benhamou. Pour plus de précisions voir les commentaires ;-)

- page 7 de 8 -